医学统计方法的R语言实现v2022
💡专注R语言在🩺生物医学中的使用
免费千人🐧QQ交流群:613637742
使用R语言进行医学统计分析是我学习R语言的初衷,所以医学统计方法的R语言实现一直本号的重要内容之一,通过整理这些推文,也确实让我进步颇多!
本篇是对过去1年中,所有介绍过的医学统计方法的推文汇总。最开始想叫医学统计方法的R语言实现大全,但仔细想想,这些不过是九牛一毛,现在就叫大全,太不符合实际了!
所以就叫医学统计方法的R语言实现v2022,这是一个阶段性的终点,同时也是一个起点,以后还会有v2023/v2024...
我最开始学习时用的是笨方法,每一行代码都是我一个字母一个字母敲上去的,每一个数据都是我一个数字一个数字录进去的,后来随着学习的深入,才学会了直接读取不同格式的数据,不用自己录入数据了。所以前期的推文看上去代码略显笨拙,这些都是学习的痕迹!
首先是梦开始的地方,一些常见的基础统计分析方法,比如t检验、方差分析、秩和检验、卡方检验、线性回归、logistic回归等,这部分内容很简单,SPSS也能很好的完成,对初学者来说甚至SPSS更简单,这部分所有的内容,我都是对照孙振球第4版医学统计学中的例题进行的,因为对初学者来说,使用其他数据很难判断自己做的到底对不对!书籍电子版和配套数据也都放在了QQ群中,方便大家下载使用。
以上是base r
实现的医学统计方法,但是缺点很明显,一次只能检验1个变量,不如SPSS简单灵活,比如我同时收集一群人的身高、体重、BMI、血糖,分为对照组和实验组,在SPSS中可以轻松对多个变量同时比较不同组的差异,在R中就要写循环,对于初学者来说,写循环显然不是一个好的选择,所以又接着介绍了tidy
风格的实现方法,不用写循环也能同时对多个变量进行检验了,真的是很方便:
后来随着学习的不断深入,我对前面几篇内容进行了简单的整理,主要是多重比较、卡方检验、方差分析部分,并增加了一些新的内容,特别是方差分析部分,涵盖了孙振球第4版医学统计学中关于方差分析的所有内容!这些让我受益匪浅,尤其是重复测量的方差分析!
接下来是学习logistic回归的各种类型以及判别分析实现方法,并通过学习这部分内容,了解了分类变量进行回归分析的各种编码方案,比如哑变量编码、simple coding、deviation coding、正交多项式编码、helmert coding等,这些知识不是仅限于R语言,在SPSS、SAS、Stata等软件中,都是类似的编码方式!对于理解回归系数和常数项的计算有非常大的帮助。
对相关性分析也补充了偏相关、半偏相关、典型相关的内容,并介绍了一些绘图方法:
到这里为止,是一个很明显的分水岭,阅读量差异很大...可能以上内容确实有些简单,而且和SPSS相比确实没有明显的优势。
以下的内容因为涉及到一些花里胡哨的可视化方法,这方面SPSS确实相形见绌,比R差远了。
首先是聚类分析、主成分分析、因子分析,以及它们的可视化方法,其中主成分分析的可视化这篇,是我目前阅读量最高的一篇,看来大家对美的追求都是相似的...
ROC曲线这部分是我写推文最多的一部分内容,关于各种各样的ROC曲线,分类资料的、生存资料的、最佳截点、平滑曲线、可信区间、ROC曲线比较等,全部包括了,真的是非常全,但是以后可能还是会有相关的内容。
接下来是大家非常感兴趣的部分:生存分析。这部分内容在临床中也是非常常用的内容,所以我写的很详细,从简单到复杂,寿命表、K-M法、Cox回归、竞争风险模型、以及相关的可视化方法都进行了详细的介绍,很多东西,确实是之前不怎么注意的,比如不满足等比例风险假设时,应该怎么处理?除此之外,在生信数据挖掘中也经常用到生存分析,不过目前批量生存分析还没介绍,后面会抽空补上。
除此之外,还介绍了一些控制混杂的方法,以及一些文献中常见的指标的实现,有些方法在临床中用的不多,可能更加偏向于流行病学、预防医学方面,所以这部分也是浅尝辄止,只是介绍了一些皮毛,不过没想到大家竟然很喜欢!
p for trend/ p for interaction/ per 1 sd 的R语言实现
接下来介绍的这部分内容我觉得非常重要,主要就是单因素分析和多因素分析的关系,想必大家经常遇到先进行单因素分析,有意义的继续进行多因素分析,这种情况对吗?有什么道理吗?为什么有的变量在单因素分析是保护因子,到了多因素就变成了危险因子? 让我来说我是说不明白的,所以特地转载统计学大佬冯国双老师的几篇推文,让大家彻底搞清楚其中的原理。一共4篇推文,值得大家仔细阅读!
最后一部分学习了一下R语言中的非线性拟合的实现方法,主要是限制性立方样条和多项式回归,这些方法也是近期用的逐渐多起来,可能和最近数据库挖掘的火爆有关。这些都是非线性拟合的内容,所以放在一起介绍,首先还是介绍非线性拟合的基本概念,为什么要使用非线性拟合,样条回归和非线性拟合的关系,然后逐渐过渡到R语言实现。
OK,以上就是医学统计学部分2022年的全年总结,内容不少,有简单的也有复杂的,基本能涵盖临床中常见的统计方法。不过更多是偏向于如何使用R语言实现。
以后的医学统计相关的推文将会继续给大家带来更多内容的解释、细节的解读、多种方法的比较、结果的可视化等,如果大家有比较感兴趣的内容,也欢迎留言或私信。
2022完结撒花✿✿ヽ(°▽°)ノ✿
最后,祝大家新的一年心想事成,万事顺利!
免费千人🐧QQ交流群:613637742
🔖精选合集